Audio Processing

All Posts in Audio Processing

PyTorch-MFCC

Project Description: MFCC for PyTorch 디테일한 내용을 생략하고 후기로 넘어가려면 여기를 클릭 MFCC는 현재 가장 인기 있는 오디오 특징값 추출 알고리즘입니다 (알고리즘에 대한 자세한 설명은 여기를 참조). 특히 이 알고리즘은 최근 음성인식/장르인식 등을 위한 기계학습 모델에서 오디오 데이터의 전처리 기법으로 널리 사용되고 있습니다. 그러나 2019년 6월 현재 PyTorch에서는 이 알고리즘을 지원하지 않고 있습니다. 현재 MFCC는 python_speech_features와 같은 라이브러리를 통해 추출되고 있으나, 이들은 PyTorch와의 호환성이 없어 PyTorch의 강력한 Autograd를 사용할 수 없다는 치명적인 약점이 있습니다. 이...

Audio Processing

Jinwoo Nam's profile image

Jinwoo Nam

2019-08-17 22:00